Les apports du TAL à la lisibilité du français langue étrangère

نویسندگان

  • Thomas François
  • Cédrick Fairon
چکیده

This paper presents a set of experiments aiming to (1) assess the contribution of NLP to the specific issue of the readability of texts for French as a foreign language (FFL) readers and (2) to propose a new readability formula for FFL. This new model relies on 46 textual features representative of the lexical, syntactic, and semantic levels as well as some of the specificities of the FFL context. We report comparisons between several techniques for feature selection and for various learning algorithms. Our best model, based on support vector machines (SVM), significantly outperforms previous FFL formulas. Regarding the contribution of NLP to readability, our findings suggest that NLP-based models are not significantly better than the classic ones, although combining both type of information leads to significant improvment. MOTS-CLÉS : lisibilité du FLE, traitement automatique du langage, difficulté des textes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

La représentation formelle des concepts spatiaux dans la langue

Dans ce chapitre, nous faisons l'hypothèse que l'étude systématique de la sémantique des marqueurs spatiaux de la langue permet de mettre en évidence certaines propriétés et concepts fondamentaux caractérisant les représentations conceptuelles de l'espace. Nous proposons un système formel rendant compte des propriétés révélées par les analyses linguistiques, et nous utilisons ces outils pour re...

متن کامل

Vers un système de traduction automatique : français/langue des signes française (TLF)

RÉSUMÉ. Notre travail se situe dans le cadre de la traduction automatique du français vers la langue des signes française (LSF) avec synthèse de gestes au moyen d’un signeur virtuel. Nous présentons tout d’abord quelques éléments descriptifs et théoriques de la LSF. Après avoir situé notre travail, nous proposons une formalisation de la partie dite standard du lexique de la LSF et de quelques p...

متن کامل

Violence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant

L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 54  شماره 

صفحات  -

تاریخ انتشار 2013